查看原文
其他

群组网络霍克斯过程

钟凯名 狗熊会 2024-05-07
点击“蓝字”关注我们吧!



钟凯名,复旦大学大数据学院应用统计专业在读硕士生。





大家好!今天和大家分享一篇论文,标题为Group Network Hawkes Process,这篇论文提出了一种群组网络霍克斯过程模型,来描述一个网络中个体间的动态互动。文章已被JASA期刊接收,论文引用:Fang, G., Xu, G., Xu, H., Zhu, X., Guan, Y. (2023) “Group Network Hawkes Process”, Journal of the American Statistical Association, accepted.

1.引言

使用点过程模型对各类网络上的活动进行建模越来越受到欢迎,例如在线社交网络中的发帖活动、金融网络中的公司交易以及大脑网络中的神经元脉冲。本文的主要目标是为异质性节点组成的网络上观测到的随机事件开发一个新的建模框架。虽然所提出的框架适用于分析一般性的事件时间数据,但本文主要以从新浪微博上搜集的数据集为背景对模型进行描述。

该数据集包含2014年1月1日至1月15日期间2038名新浪微博用户的发帖时间。图1显示了用户发帖模式的高度异质性和复杂性。首先,用户发帖数的分布体现了不同用户之间活跃度的巨大差异:虽然大多数用户在研究时期内的发帖数少于200,但也存在小部分用户的发帖极为活跃。其次,对所有用户在不同时间段发帖的总体强度进行汇总,得到的平均值表明:用户的发帖存在明显的每日周期性模式。最后,用户与好友发帖的时间间隔和用户与随机挑选的非好友发帖的时间间隔数量级差异很大。好友之间发帖时间间隔的数量级始终小于非好友之间时间间隔的数量级,这表明用户的活动在很大程度上受到其好友的影响。

多元霍克斯过程(Hawkes, 1971)是一个用于如本文示例数据这一类事件时间数据的经典模型,它已被广泛应用于对犯罪学(Linderman and Adams, 2014)、金融学(Bacry et al., 2013)、信息扩散(Farajtabar et al., 2017)和社会研究(Zhou et al., 2013; Fox et al., 2016)等多个领域多种类型的事件时间建模。而在网络结构的前提下,现有研究主要分为两类,其中一类利用观测到的事件时间数据恢复未知的网络结构(Zhou et al., 2013; Xu et al., 2016; Achab et al., 2018; Bacry et al., 2020)。与此相反,另一类研究假设网络结构是给定的,并将其纳入事件时间数据的建模框架中(Fox et al., 2016; Farajtabar et al., 2017; Zarezade et al., 2018)。在第二类研究框架中,模型参数被假设为是特定于节点的,因此参数数量会至少随节点数量呈线性增长。这时若网络中有很多节点只产生稀少的事件时间,就会出现问题,图1中的情况就是如此。

在此基础上,本文提出群组网络霍克斯过程(GNHP),通过在网络节点之间引入潜在群组结构来模拟网络的同质性。假设同一群组中的节点具有相似的节点特征,任何两个相连节点之间的互动模式都由其群组成员身份决定。对于每个潜在的群组,背景强度随时间变化,并由样条基函数非参数近似。与所有网络节点都被视为不同的现有模型(Fox et al., 2016; Farajtabar et al., 2017; Zarezade et al., 2018)相比,本文所提出的模型更加简洁,但潜在的群组结构和观察到的网络结构仍然使我们能建立足够灵活的多元霍克斯过程网络模型。此外,本文提出的GNHP模型允许一个等效的分支过程结构,使我们能够开发易于解释的数值度量来量化网络内的相互作用。这种分支结构还使我们能够开发出一种计算高效的EM算法来进行模型的估计。最后,估计出的群组成员身份以数据驱动的方式将网络中的节点聚类为多个子群体,从而能够进一步深入了解网络的动态活动。因此,本文提出的GNHP模型是对现有网络中事件时间数据分析方法的重要补充。

2.群组网络霍克斯过程

2.1.霍克斯过程背景知识

表示[0, T]中时间点过程的实现,并设是一个关联计数过程,其中是一个示性函数。设为截至时间t的过程历史,点过程的条件强度函数定义为,经典霍克斯模型(Hawkes, 1971)假定的形式为:

其中是事件的一个背景率,是一个非负的触发函数。霍克斯过程被认为是“自激励”的,因为过去的事件会通过时刻的瞬时强度产生影响。触发函数控制了时刻的强度与过去事件之间的依赖区间和依赖度,经典的选择包括指数核(Hawkes, 1971)和幂律核(Ogata, 1988)。

2.2.带有潜在群组结构的网络霍克斯过程

这一节中文章将经典的霍克斯过程扩展到具有潜在群组结构的网络设定。考虑一个有个节点的网络,其中节点之间的关系由邻接矩阵表示,如果第个节点关注了第个节点,则为,否则则为。方便起见,设网络中不存在节点自连接的情况,即。为了解释网络节点的潜在异质性,我们假设网络中的节点属于个潜在群组,其中同一组中的节点具有相同的节点特定特征,并与其他群组的节点之间存在交互。

为所有节点的潜在群组身份向量,其中. 对于节点是观察到的个事件时间,并且是一个关联计数过程。给定群组身份向量和事件历史,其中,本文提出的GNHP模型假定第个节点的条件强度为以下形式:

,其中为背景强度,的触发函数。是节点的出度(Zhu et al., 2017),是未知的群组级参数,。参考Chen et al.(2017),假设的支撑集为[0, b],例如可以是截断的指数核:

γγ

本文的理论研究允许当,时,截断区间。为了获得参数的可识别性,假设对于任何给定的,有。此外,假设.

式(2)中的条件强度,可以被分解为以下三个部分:

  • 背景强度,描述了节点的整体活动模式。

  • 动量强度,建模了节点自身历史事件对新事件在时间t发生的“自激励”影响。

  • 网络强度,建模了其他节点的历史事件对节点i在时间t发生新事件的影响。

出度的作用是阻止当网络强度的膨胀,这在现有文献中是常见的做法(Zhu et al., 2017, 2019). 网络强度中的表示节点i相连节点对它的平均网络影响。最后,需要注意的是动量强度网络强度中的触发函数不需要具有相同的形式。

本文所提出GNHP模型的网络依赖性可以由转移矩阵来描述,其中. 下一小节中文章在以下假设的基础上进一步讨论了矩阵的性质。

假设1 假设,其中是一个正的常数

假设1是多元霍克斯过程平稳性的充分条件,已经于现有文献中被广泛应用,例如:Hansen et al. (2015); Chen et al. (2017)。对于GHNP模型,它也是一个充分条件,保证了在任何网络节点上由母事件触发的子事件数量的期望都是有限的。

2.3.GNHP模型的分支结构

Hawkes and Oakes(1974)为经典的Hawkes过程式(1)提供了一个等效的分支结构表示,它将观察到的事件分为两个不相交的过程:强度为的母泊松过程,以及由历史事件触发的子过程。经典霍克斯过程的分支结构如图2中的左图所示。

参考Rasmussen(2013)和Halpin et al.(2013)的研究,可以推导出GNHP模型的分支结构,通过将所有节点聚合的点过程记作,作为[0, T]中一个标记的点过程,其中所有的标记都是发生事件的节点的索引。具体来说,中的事件时间可以分为两种类型:母事件和子事件。设是节点的母事件集合,,其中是由一个母事件产生的子事件的集合。注意由于网络之中的交互,可能包含了其他节点的事件时间。分支结构的定义如下,图2中的右图是该分支结构的形象描述。

  1. 对于任意,母事件服从一个强度为的泊松过程,并且所有泊松过程是相互独立的。

  2. 每个母事件生成一个子事件的集合,并且所有因此产生的是独立的。每个中的事件时间递归地生成如下。

    (a)第0代,记作,只由组成,即.

    (b)在生成代的后代事件时间后,中的每个事件时间又生成一系列代的事件时间。具体来说,假设是一个位于第个节点的事件时间,然后在时间间隔[t_{jl},T]上生成:(i) 在节点j上强度为的泊松过程;(ii)对任何,节点上一个强度为的泊松过程。所有泊松过程是独立的。

    (c)得到


定理1表示发生在网络节点子集上的事件总数,这些事件是上第个节点的一个母事件的子事件。则在假设1下,有:

其中是一个向量,所有在中的索引对应值都为1,其余位置值都为0,且.

定理1提供了一个有效的工具来量化网络中的交互。例如:

  • 节点对节点的影响: 的第项给出了节点上由第个节点上的母事件触发的平均事件数(设

  • 节点对网络的影响: 通过设置,得到的第列的和,即整个网络中由第个节点上的母事件直接/间接触发的事件的平均数量,即

  • 群组间的动态影响:是群组中节点索引的集合。记为群组中发生在内的母事件触发的事件总数,反映了群组对群组的影响力。基于定理1,可以证明. 随后可以定义极限情况如下:

2.4.与现有文献的比较

对多元霍克斯过程的研究有很多(如Zhou et al., 2013; Bacry et al., 2013; Chen et al., 2017),条件强度的模型一般可以表示为:

其中是节点的背景率,是节点和节点之间的转移函数。现有的多元霍克斯过程模型的区别主要是围绕的构建。一种流行的建模策略是假设, 带有一些参数的。该模型总共涉及的参数,这限制了其只适用于相对较小的应用(例如,Bacry et al., 2013). 当建模一个大型网络时,需要对施加一些稀疏结构,在这种情况下,非零的意味着节点i直接受到节点的影响,估计的可能有助于恢复潜在的网络结构(例如,Xu et al., 2016; Bacry et al., 2020). 虽然这方面的大多数工作缺乏严格的理论,但最近也有一些关于m发散时这类模型的理论研究,如Hansen et al.(2015), Chen et al.(2017)和Cai et al.(2020)。

现有研究中也存在大量关于网络节点集群识别的文献(如Zhao et al., 2012; Amini et al., 2013),通常被称为“社区发现”。需要注意社区发现文献中的“社区”概念与所提出的GNHP模型中的“群组”有根本上的不同。在社区发现中,假设网络的邻接矩阵是一个由伯努利随机变量组成的随机矩阵,节点社区的识别主要依赖于条件概率。然而,GNHP中的邻接矩阵被认为是确定性的,并且没有与之相关的概率。相比之下,GNHP中的群组是通过最大化从所有网络节点收集到的事件时间的似然函数而形成的,并且同一群组中的节点必须共享相似的节点特定特征,如. 尽管最近社区发现文献中的一些研究也利用节点特征来帮助识别社区(Yan and Sarkar, 2021; Zhang et al., 2021; Weng and Feng, 2022),但这些模型的核心部分仍然是。当所有节点相互孤立(即中所有元素为0)时,差异最为明显,手动设置为0时GNHP仍然有效,但由于此时不再存在网络,社区发现不再有效。此外,最近Matias et al.(2018)的工作在扩展连续时间内周期性相互作用事件的随机块模型时也同时考虑了潜在群组结构。他们的工作和本文之间的关键区别在于,他们要求每个观察到的事件时间与一个标签相关联,表明该事件是哪两个节点之间的相互作用。然而,这些信息在GNHP建模的事件时间中是不可用的,与之不同GNHP关注的是发生在单个节点上的事件建模,但可能存在一些相关性。事实上,正如第2.3节中有关分支结构的部分所述,识别GNHP中一个事件的触发源头是最具挑战性的任务。类似地,在极端情况下,当每个节点上只存在自活动,但任何一对节点之间都不存在交互时,Matias et al.(2018)不适用,但当设置为0时,GNHP模型仍然有效。

第二类研究的重点则是利用已知网络结构通过参数化来分析网络活动(例如Fox et al., 2016; Farajtabar et al., 2017; Zarezade et al., 2018)。例如,Fox et al.(2016)模拟了网络中的电子邮件通信,通过假设,其中是未知参数,使未知参数的总数减少为了。Farajtabar et al.(2017)和Zarezade et al.(2018)也研究了类似但更加复杂的模型。

我们提出的GNHP模型属于第二类研究,具有四个不同的特征:(a) 背景强度允许为时变的,并且使用样条基函数进行非参数近似,这提供了更大的建模灵活性. (b) 模型(2)中的动量强度在给定网络结构的条件下有清晰的解释。(c) 网络节点上的潜在群组结构不仅自然地解释了普遍观察到的网络异质性,而且有效地减少了参数的数量。(d) 通过使用第2.3节中讨论的各种影响度量,网络节点中估计出的群组成员关系可以为网络活动提供进一步的发现。

3.模型估计

3.1.背景强度的近似

如图1所示,人类的活动,如社交媒体上的发布,往往表现出周期性的模式。因此,我们假设给定节点的背景强度为周期形式,其中存在一个有限的。对于本文的实际数据示例,选择天(或24小时)来解释日常发帖行为是很自然的。本文提出的模型不假设的限制性参数形式,而是使用周期样条来近似。令为定义在ω上的基函数的一个集合,是小于等于的最大整数,则近似于

其中,是待估计的系数向量。对于样条基函数,设置如下的假设:

假设2. 假设存在一个常数使得满足:(a);(b), 且对,有,其中是一个有限的整数。用表示群组的真实背景函数,并假设对于某些常数,有:

假设2要求真实的背景强度函数可以通过样条基函数的线性组合来很好地近似,这对于许多样条族来说是一个容易满足的要求。

3.2.极大似然估计

对于任意的,记分别作为中参数的参数空间。此处代表. 设为群组成员身份向量的参数空间. 对于参数空间,提出如下的假设:

假设3. 存在, 使得:(a);(b) ;(c).

为节点个邻居节点,中节点对应的群组成员身份向量,重新设置量纲的交互作用参数. 中的一项是为了便于理论研究,没有实际的意义。可以看出,节点的条件强度(2)只依赖于,因此可以重写为:

. 记参数向量. 因此,所提出的GNHP的尺度对数似然函数(除以)可以被证明具有以下形式:

为了便于表示,从现在开始,记 ,则得到参数的MLE:其中

3.3EM算法

直接最大化(10)式是一个具有大量参数的非凹问题,在计算上具有挑战性。在本节中,文章利用第2.3节中给出的分支结构,提出了一个更有效的算法。

对于节点时刻发生的第k个事件,定义,其中表示母事件,否则表示第个事件由节点时刻的第个事件触发。给定,节点的事件时间可以归类为:

  1. 的母事件,它组成了上的一个强度为的泊松过程的实现。则对数似然可以被写成:
  1. 所有的都是由节点i的过去的事件触发的,即。它构成了对任意,强度为的泊松过程的实现。所有此类事件的联合对数似然都是以下的形式:
  1. 所有的都是由节点的一个过去的事件触发的,即,对。它构成了对任意,强度为的泊松过程的实现。所有此类事件的联合对数似然都是以下的形式:

因此,当观察到时,通过第2.3节中给出的分支结构,所提出的GNHP的完整的对数似然形式为:

则MLE(11)可以通过使用完整似然(15)的EM算法得到,Veen and Schoenberg(2008);Halpin et al.(2013);Fox et al.(2016)等研究中也使用了类似的方法。由于似然(10)是非凹的,因此群组成员身份和模型参数的初始值是至关重要的,本文建议结合使用K-means算法和随机EM算法来生成合理的初始值。

3.4群组数的选择

将潜在群组的真实数量表示为。原文中第4节的定理2-4表明在适当的条件下,模型参数的MLE与理论对应的MLE是一致的,并且只要,就可以正确估计所有节点的群组成员身份。然而,根据原文中的定理5,的渐近正态性依赖于的假设。因此,开发一个数据驱动的准则来确定具有现实意义。

为在给定的条件下从(11)中获得的MLE。考虑如下基于似然的准则函数:

其中的定义如(10)式所示,并且是一个依赖于m和T的调整参数。最优的通过选择得到。如果满足定理3中的比率条件,则在适当的条件下,可以以趋近于1的概率选择到

4.实证研究:新浪微博数据集

在实际数据分析部分,本文将GNHP模型应用于从新浪微博收集的数据集,文章收集了2014年1月1日至15日期间名用户的发贴时间戳,小时。图6给出了詹姆斯·卡梅伦发布的两个微博帖子示例。利用用户间的关注-被关注关系构造网络的邻接矩阵,计算得到网络密度,表明这是一个高度稀疏的网络。图6给出了网络的入度和出度的分布,我们可以看到入度往往比出度更加偏态。这是社交网络平台上的典型现象,少数有影响力的用户可能有大量的关注者,而大多数用户不会关注太多的其他用户。

4.1.模型估计与解释

使用周期性的B-样条基来近似GNHP模型的背景强度,其中是等距分布在上的结,(小时),触发函数的形式如式(3),(小时)。为了更好的数值稳定性,我们对参数设置了上界100。使用3.3节中提出的具有200个初始群组成员身份的EM算法和用补充材料A.2节中的算法得到的参数估计,首先使用式(16)中给出的LIC准则来选择潜在群组的数量,其中. 从图7中可以看出,当G从1变为2时,对于所有的选择,LICs都急剧增加,这表明使用潜在群组结构来模拟网络节点之间的异质性是合适的。对于所有的选择,LIC选择的最优组数为

下一步是选择最佳的,为此本文提出以下BIC类准则:

其中是用式(11)中的MLE计算得到的式(10)中的对数似然。

启发式地,可以粗略地解释为随着时间的推移弱依赖重复的数量,可以看作是分布在群组上的结的总数。固定,图7显示了在时获得的最小BIC值。使用和G估计的背景强度如图7所示,得到的参数估计值如表6所示。

图7显示,所有估计的背景强度在上午10点和晚上8点左右都有两个峰值,这表明用户在这些时间更活跃。根据估计的GNHP模型和不同群组中的用户信息,我们将各群组总结如下。

  • 群组1是最大的群组,包括49.8%的用户,他们全天的背景强度最低。从来看,该群组用户对其他群组用户的影响相对较小。该群组的值也最大,说明用户过去发布的帖子对其未来发布行为的影响时间最短。

  • 群组2包括许多在各种社区(如娱乐、商业、教育和社会科学)中扮演主要角色的用户,他们通常全天不经常发布内容。该组的值第二小,表明用户过去的帖子具有相对较长的时间效应。估计的表明,这一群组的用户对除群组3外所有群组的影响最大。在文章后续的分析中表明,这一群体是第二大影响力群体。

  • 群组3主要是一些新闻媒体的账号。图7显示了这个组平均来说是最活跃的,这可能是由于他们的任务是及时传递信息。它的最小,表明对发帖历史的时间依赖性最长。同时,它有一个非常大的值,这表明这个群组不太可能受到其他群组过去帖子的影响。虽然估计的不像群组2那么大,但这一组最大的背景强度使其成为最具影响力的群组。

  • 群组4由图7中所示经常发帖的用户组成,但根据估计的,这一群组对其他群组的影响相当有限。它的较大,说明该组的用户受第2组用户的影响较大。

4.2.群组解释和强影响力用户分析

在社交网络分析中,识别有影响力的用户是一项重要的任务,因为它可以帮助提高新闻传播、产品发布和促销活动开展的效率。为了识别最具影响力的用户,我们首先将用户i的影响力定义为的第列的和,即定理1给出的节点对网络的影响力。影响力排名前20位和前100位的用户柱状图如图8所示,可以看出,影响力排名前20位的用户仅由群组2和群组3的成员组成,其中群组3的影响力最大。这一观察结果在前100名最具影响力用户的柱状图中得到进一步证实,其中大多数用户都来自群组2和群组3。

为了更清楚地说明不同群组之间的相互作用,图8给出了每个群组对其他群组的影响曲线,如式(5)所定义。正如预期的那样,群组1和群组4全天对其他群组的影响都相当有限。最有影响力的群组3对群组2的影响最大,这表明群组2的用户可能最需要群组3的用户提供的及时信息。群组4受群组3的影响比群组1更大,可能是因为群组4的用户相对更活跃,因此可以更快地对群组3的信息做出反应。最后,群组3对群组1和群组4的影响非常相似,这是一个有趣的现象,可能需要深入研究。总体而言,影响力图和影响曲线图揭示了社交网络用户之间一些有趣的互动模式,显示了所提出的GNHP模型的潜在作用。

5. 总结

本文提出了一种适用于分析大型网络中异质性用户动态行为模式的群组网络霍克斯过程(GNHP)。GNHP模型利用网络结构对经典霍克斯过程模型进行了扩展,并引入了潜在群组结构来解释网络用户之间的异质性。此外本文深入研究了EM算法的理论性质,提出了一种计算效率高的EM算法。正如对新浪微博数据集的应用中所证明的那样,GNHP模型具有优秀的可解释性。

参考文献

Achab, M., Bacry, E., Gaiffas, S., Mastromatteo, I., and Muzy, J.-F. (2018), “Uncovering causality from multivariate Hawkes integrated cumulants,” Journal of Machine Learning Research, 18, 1–28.

Amini, A. A., Chen, A., Bickel, P. J., and Levina, E. (2013), “Pseudo-likelihood methods for community detection in large sparse networks,” The Annals of Statistics, 41, 2097–2122.

Bacry, E., Bompaire, M., Ga¨ıffas, S., and Muzy, J.-F. (2020), “Sparse and low-rank multivariate Hawkes processes,” Journal of Machine Learning Research, 21, 1–32.

Bacry, E., Delattre, S., Hoffmann, M., and Muzy, J.-F. (2013), “Modelling microstructure noise with mutually exciting point processes,” Quantitative Finance, 13, 65–77.

Cai, B., Zhang, J., and Guan, Y. (2020), “Latent network structure learning from high dimensional multivariate point processes,” Working Paper.

Chen, F. and Hall, P. (2013), “Inference for a nonstationary self-exciting point process with an application in ultra-high frequency financial data modeling,” Journal of Applied Probability, 50, 1006–1024.

Chen, S., Shojaie, A., Shea-Brown, E., and Witten, D. (2017), “The multivariate Hawkes process in high dimensions: Beyond mutual excitation,” arXiv preprint arXiv:1707.04928.

Farajtabar, M., Wang, Y., Gomez-Rodriguez, M., Li, S., and Zha, H. (2017), “COEVOLVE: A joint point process model for information diffusion and network evolution,” Journal of Machine Learning Research, 18, 1–49.

Fleming, T. R. and Harrington, D. P. (2011), Counting processes and survival analysis, vol. 169, John Wiley & Sons.

Fox, E. W., Short, M. B., Schoenberg, F. P., Coronges, K. D., and Bertozzi, A. L. (2016), “Modeling e-mail networks and inferring leadership using self-exciting point processes,” Journal of the American Statistical Association, 111, 564–584.

Halpin, Peter, F., Boeck, D., and Paul (2013), “Modelling dyadic interaction with Hawkes processes,” Psychometrika, 78, 793–814.

Hansen, N. R., Reynaud-Bouret, P., Rivoirard, V., et al. (2015), “Lasso and probabilistic inequalities for multivariate point processes,” Bernoulli, 21, 83–143.

Hawkes, A. G. (1971), “Spectra of some self-exciting and mutually exciting point processes,” Biometrika, 58, 83–90.

Hawkes, A. G. and Oakes, D. (1974), “A cluster process representation of a self-exciting process,” Journal of Applied Probability, 11, 493–503.

Linderman, S. and Adams, R. (2014), “Discovering latent network structure in point process data,” in International Conference on Machine Learning, pp. 1413–1421.

Liu, R., Shang, Z., Zhang, Y., and Zhou, Q. (2020), “Identification and estimation in panel models with overspecified number of groups,” Journal of Econometrics, 215, 574–590.

Matias, C., Rebafka, T., and Villers, F. (2018), “A semiparametric extension of the stochastic block model for longitudinal networks,” Biometrika, 105, 665–680.

Mohler, G. O., Short, M. B., Brantingham, P. J., Schoenberg, F. P., and Tita, G. E. (2011), “Selfexciting point process modeling of crime,” Journal of the American Statistical Association, 106, 100–108.

Ogata, Y. (1978), “The asymptotic behaviour of maximum likelihood estimators for stationary point processes,” Annals of the Institute of Statistical Mathematics, 30, 243–261.

— (1988), “Statistical models for earthquake occurrences and residual analysis for point processes,” Journal of the American Statistical association, 83, 9–27.

Rasmussen, J. G. (2013), “Bayesian inference for Hawkes processes,” Methodology and Computing in Applied Probability, 15, 623–642.

Sch¨utze, H., Manning, C. D., and Raghavan, P. (2008), Introduction to information retrieval, vol. 39, Cambridge University Press Cambridge.

Su, L., Shi, Z., and Phillips, P. C. (2016), “Identifying latent structures in panel data,” Econometrica, 84, 2215–2264.

Veen, A. and Schoenberg, F. P. (2008), “Estimation of space-time branching process models in seismology using an EM-type algorithm,” Journal of the American Statistical Association, 103, 614–624.

Weng, H. and Feng, Y. (2022), “Community detection with nodal information: likelihood and its variational approximation,” Stat, 11, e428.

Xu, H., Farajtabar, M., and Zha, H. (2016), “Learning granger causality for hawkes processes,” in International Conference on Machine Learning, pp. 1717–1726.

Yan, B. and Sarkar, P. (2021), “Covariate regularized community detection in sparse graphs,” Journal of the American Statistical Association, 116, 734–745.

Zarezade, A., De, A., Upadhyay, U., Rabiee, H. R., and Gomez-Rodriguez, M. (2018), “Steering social activity: a stochastic optimal control point of view,” Journal of Machine Learning Research, 18, 1–35.

Zhang, J., He, X., and Wang, J. (2021), “Directed community detection with network embedding,” Journal of the American Statistical Association, 1–11.

Zhao, Y., Levina, E., Zhu, J., et al. (2012), “Consistency of community detection in networks under degree-corrected stochastic block models,” The Annals of Statistics, 40, 2266–2292.

Zhou, K., Zha, H., and Song, L. (2013), “Learning social infectivity in sparse low-rank networks using multi-dimensional hawkes processes,” in Artificial Intelligence and Statistics, pp. 641–649.

Zhou, S., Shen, X., Wolfe, D., et al. (1998), “Local asymptotics for regression splines and confidence regions,” Annals of Statistics, 26, 1760–1782.

Zhu, X., Pan, R., Li, G., Liu, Y., and Wang, H. (2017), “Network Vector Autoregression,” The Annals of Statistics, 45, 1096–1123.

Zhu, X., Wang, W., Wang, H., and H¨ardle, W. K. (2019), “Network quantile autoregression,” Journal of econometrics, 212, 345–358.

Zhu, X., Xu, G., and Fan, J. (2022), “Simultaneous estimation and group identification for network vector autoregressive model with heterogeneous nodes,” arXiv preprint arXiv:2209.12229.

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存